昨天介紹了 LangChain 生態系中的各個組件,這些組件是生成式 AI 開發的基礎,然而 LangChain 的核心在於如何通過 Chain 進行擴展和優化。今天將著重在兩個重要環節-Query 提問優化 和 Retrieval 檢索優化,在 RAG 開發上,這兩項優化策略能提升資料檢索的覆蓋範圍與準確性。
以下部份主要是概略性的介紹不同優化策略的作法,其實看到 source code 會發現多是由 LLM 和 prompt 組合而成,chain 的使用方法也很簡單,套用參數就可以了,然而開發的重點會在於如何串接這些 chain,以及如何設計這些優化流程,而這會在明天自訂邏輯的地方介紹。
Query 提問優化能將使用者的問題拆解為多個相關查詢,幫助檢索更多有用的資訊。
sourse: langchain
「如何成為 SI 工程師?需要哪些技能?」
「SI 工程師的職責是什麼?」
「SI 工程師需要懂哪些程式語言?」
「SI 工程師在工業自動化中的角色?」
「SI 工程師的專業技能在哪些行業最為重要?」
「SI 工程師如何應用於自動化?」
sourse: langchain-RefineDocumentsChain
Retrieval 優化則專注於改善從資料源獲取的文檔質量,以下最常見的四種 chain 來說,都是將檢索出來的文件以不同方式整理再連同原始問題匯給 LLM 問答時讀取。
ref.